在过去的几年中,世界已转向多核和多核共享内存体系结构。结果,通过将共享内存并行化方案引入软件应用程序,越来越需要利用这些体系结构。 OpenMP是实现此类方案的最全面的API,其特征是可读接口。然而,由于平行共享内存的管理中普遍存在的陷阱,将OpenMP引入代码很具有挑战性。为了促进此任务的性能,多年来创建了许多源代码(S2S)编译器,任务是将OpenMP指令自动插入代码。除了对输入格式的鲁棒性有限外,这些编译器仍然无法在定位可行的代码和生成适当指令时获得令人满意的覆盖范围和精确度。在这项工作中,我们建议利用ML技术的最新进展,特别是自然语言处理(NLP),以完全替换S2S编译器。我们创建一个数据库(语料库),专门用于此目标。 Open-Opm包含28,000多个代码片段,其中一半包含OpenMP指令,而另一半根本不需要并行化。我们使用语料库来培训系统来自动对需要并行化的代码段进行分类,并建议单个OpenMP条款。我们为这些任务培训了几个名为Bragformer的变压器模型,并表明它们的表现优于统计训练的基线和自动S2S并行化编译器,这既可以分类OpenMP指令的总体需求,又要介绍私人和还原条款。我们的源代码和数据库可在以下网址获得:https://github.com/scientific-computing-lab-nrcn/pragformer。
translated by 谷歌翻译
While the capabilities of autonomous systems have been steadily improving in recent years, these systems still struggle to rapidly explore previously unknown environments without the aid of GPS-assisted navigation. The DARPA Subterranean (SubT) Challenge aimed to fast track the development of autonomous exploration systems by evaluating their performance in real-world underground search-and-rescue scenarios. Subterranean environments present a plethora of challenges for robotic systems, such as limited communications, complex topology, visually-degraded sensing, and harsh terrain. The presented solution enables long-term autonomy with minimal human supervision by combining a powerful and independent single-agent autonomy stack, with higher level mission management operating over a flexible mesh network. The autonomy suite deployed on quadruped and wheeled robots was fully independent, freeing the human supervision to loosely supervise the mission and make high-impact strategic decisions. We also discuss lessons learned from fielding our system at the SubT Final Event, relating to vehicle versatility, system adaptability, and re-configurable communications.
translated by 谷歌翻译
Self-supervised learning (SSL) has been able to leverage unlabeled data to boost the performance of automatic speech recognition (ASR) models when we have access to only a small amount of transcribed speech data. However, this raises the question of which subset of the available unlabeled data should be selected for transcription. Our work investigates different unsupervised data selection techniques for fine-tuning the HuBERT model under a limited transcription budget. We investigate the impact of speaker diversity, gender bias, and topic diversity on the downstream ASR performance. We also devise two novel techniques for unsupervised data selection: pre-training loss based data selection and the perplexity of byte pair encoded clustered units (PBPE) and we show how these techniques compare to pure random data selection. Finally, we analyze the correlations between the inherent characteristics of the selected fine-tuning subsets as well as how these characteristics correlate with the resultant word error rate. We demonstrate the importance of token diversity, speaker diversity, and topic diversity in achieving the best performance in terms of WER.
translated by 谷歌翻译
虽然当前用于自动驾驶机器人导航的系统可以在静态环境中产生安全有效的运动计划,但当多个机器人必须在狭窄的空间中一起导航时,它们通常会产生次优行为。例如,当两个机器人在狭窄的走廊上相遇时,他们可以转身找到替代路线,或者相互碰撞。本文提出了一种新的导航方法,该方法允许两个机器人在狭窄的走廊中相互通过,而无需碰撞,停止或等待。我们的方法是走廊传递(PHHP)的感知幻觉,学会了合成产生虚拟障碍(即感知幻觉),以促进多个机器人在狭窄的走廊中使用,这些机器人利用原本标准的自主导航系统。与多个基线相比,我们对各种走廊中物理机器人的实验表现出改善的性能。
translated by 谷歌翻译
任何稀疏编码方法的最终目标是从几个嘈杂的线性测量值(一个未知的稀疏向量)中准确恢复。不幸的是,这个估计问题通常是NP-HARD,因此始终采用近似方法(例如Lasso或正交匹配的追踪)来接近它,从而使准确性以较小的计算复杂性进行了交易。在本文中,我们为稀疏编码开发了一种量子启发的算法,前提是,与经典近似方法相比,量子计算机和ISING机器的出现可能会导致更准确的估计。为此,我们将最一般的稀疏编码问题作为二次不受约束的二进制优化(QUBO)任务提出,可以使用量子技术有效地最小化。为了在旋转数量(空间复杂性)方面也有效地得出QUBO模型,我们将分析分为三种不同的情况。这些由表达基础稀疏向量所需的位数来定义:二进制,2位和一般的定点表示。我们使用有关Lightsolver量子启发的数字平台的模拟数据进行数值实验,以验证我们的QUBO公式的正确性,并证明其优于基线方法的优势。
translated by 谷歌翻译
本文通过讨论参加了为期三年的SubT竞赛的六支球队的不同大满贯策略和成果,报道了地下大满贯的现状。特别是,本文有四个主要目标。首先,我们审查团队采用的算法,架构和系统;特别重点是以激光雷达以激光雷达为中心的SLAM解决方案(几乎所有竞争中所有团队的首选方法),异质的多机器人操作(包括空中机器人和地面机器人)和现实世界的地下操作(从存在需要处理严格的计算约束的晦涩之处)。我们不会回避讨论不同SubT SLAM系统背后的肮脏细节,这些系统通常会从技术论文中省略。其次,我们通过强调当前的SLAM系统的可能性以及我们认为与一些良好的系统工程有关的范围来讨论该领域的成熟度。第三,我们概述了我们认为是基本的开放问题,这些问题可能需要进一步的研究才能突破。最后,我们提供了在SubT挑战和相关工作期间生产的开源SLAM实现和数据集的列表,并构成了研究人员和从业人员的有用资源。
translated by 谷歌翻译
在这个有联系的社会中,CCTV通过记录非法活动以供当局采取行动,在执行公民的安全和保障方面发挥了关键作用。在智能的城市环境中,使用深层卷积神经网络(DCNN)来检测CCTV视频中的暴力和武器暴力行为,将通过确保全天候实时检测来提供额外的安全性。在这项工作中,我们通过收集武器化和非武器暴力以及YouTube的非暴力视频的真正CCTV镜头,引入了一个新的专业数据集。我们还提出了一种新颖的方法,将连续的视频框架合并为单个显着图像,然后将成为DCNN的输入。多个DCNN架构的结果证明了我们方法的有效性99 \%。我们还通过几个参数权衡考虑了我们方法的效率,以确保智能城市的可持续性。
translated by 谷歌翻译
单个异常行为因人群的大小,上下文和场景而异。当检测,跟踪和认可异常行为的人时,诸如部分阻塞,模糊,大数字异常行为和摄像机观看之类的挑战发生在大规模的人群中。在本文中,我们的贡献是双重的。首先,我们介绍了一个注释和标记的大规模人群异常行为hajj数据集(hajjv2)。其次,我们提出了两种混合卷积神经网络(CNN)和随机森林(RFS)的两种方法,以检测和识别小型和大型人群视频中的时空异常行为。在小型人群视频中,对Resnet-50预训练的CNN模型进行了微调,以验证空间域中的每个帧是正常还是异常。如果观察到异常行为,则使用基于运动的个体检测方法基于角链光流的大小和方向来定位和跟踪具有异常行为的个体。大规模人群视频中使用了Kalman过滤器,以预测和跟踪随后的帧中检测到的个体。然后,将均值,方差和标准偏差统计特征计算出来并馈送到RF,以对时间域中的行为异常行为进行分类。在大规模的人群中,我们使用Yolov2对象检测技术微调Resnet-50模型,以检测空间域中行为异常的个体。
translated by 谷歌翻译
由于对高效有效的大数据分析解决方案的需求,医疗保健行业中数据分析的合并已取得了重大进展。知识图(KGS)已在该领域证明了效用,并且植根于许多医疗保健应用程序,以提供更好的数据表示和知识推断。但是,由于缺乏代表性的kg施工分类法,该指定领域中的几种现有方法不足和劣等。本文是第一个提供综合分类法和鸟类对医疗kg建筑的眼光的看法。此外,还对与各种医疗保健背景相关的学术工作中最新的技术进行了彻底的检查。这些技术是根据用于知识提取的方法,知识库和来源的类型以及合并评估协议的方法进行了严格评估的。最后,报道和讨论了文献中的一些研究发现和现有问题,为这个充满活力的地区开放了未来研究的视野。
translated by 谷歌翻译
深厚的增强学习(DRL)在各种机器人应用中取得了突破性的成功。自然的结果是采用这种范式来进行关键的任务,其中可以涉及人类安全和昂贵的硬件。在这种情况下,至关重要的是优化基于DRL的代理的性能,同时提供其行为的保证。本文提出了一种新型技术,用于将域专家知识纳入受约束的DRL训练环中。我们的技术利用了基于方案的编程范式,该范式旨在以简单而直观的方式指定此类知识。我们验证了有关流行的机器人地图导航问题,模拟和实际平台的方法。我们的实验表明,使用我们的方法利用专家知识极大地提高了代理的安全性和性能。
translated by 谷歌翻译